2014/11/21

[Books] Strategy+ 推薦的 2014 年最佳商業書籍


日前 Strategy+ 宣布了他們推薦的 2014 年商業好書,共分七類,每個類別各推薦三本書,包括一本年度最佳書籍。個人比較感興趣的是「商業策略類」(Strategy)、「創新類」(Innovation),和「永續發展類」(Sustainability),在此各別摘譯部分書籍介紹。

策略類的推薦書是這本:Accelerate: Building Strategic Agility for a Faster-Moving World (Harvard Business Review Press, 2014),主軸是把近年來流行的「敏捷」(agile)思維運用在企業策略上。任何商業策略都有生命週期,企業不可能不做任何調整,依靠相同的策略永遠的產生獲利,這本書提出了一些在穩定中持續變革的方法。

創新類得獎的是:Social Physics: How Good Ideas Spread—The Lessons from a New Science (Penguin Press, 2014),「社會物理學」是 MIT 人類動力實驗室開啟的一個新學門,他們用各種的工具,建立了一整套追蹤「想法」是如何被傳播與轉化成行動的方法學。

永續類 The Big Pivot: Radically Practical Strategies for a Hotter, Scarcer, and More Open World (Harvard Business Review Press, 2014),書中敘述目前世界面對的三大挑戰:全球氣候變遷,資源有限與持續上升的物價,和隨著科技發展日益升高的對「透明度」的要求。作者建議企業應該都要轉型,思考「如何用可以獲利的方式解決這些全球都必須面對的問題」,並且提出若干具體的建議。

這些書應該都會出中文版,所以可以等幾個月。迫不及待想先賭為快的,以下是原文個類別的推薦書目,Amazon 都買得到:

Strategy
To the Nimble Go the Spoils
by Ken Favaro

Marketing
Brand Diving
by Catharine P. Taylor

Executive Self-Improvement
The Human Factor
by Karen Dillon

Organizational Culture
The Nothing That's Everything
by James O'Toole

Innovation
Greasing the Skids of Invention
by David K. Hurst

Sustainability
Tomorrow's Bottom Line
by John Elkington

Economics
All Things Being Unequal
by Daniel Gross

2014/11/09

[Data Analytics] 試算表裡的人工智慧:Google 推出自動補足未知值的 Smart Autofill

Google 的試算表軟體 Google Sheets,日前推出可利用機器學習(machine learning)自動填補未知值的套件:Smart Autofill(新聞:TechCrunch | 36kr)。

數據遺失missing data)是資料處理常見的問題,在分析時通常處理的方式有兩種:這筆資料不列入分析,或是填上一個合理的值(imputation)。

當你手上的資料很多的時候,直接忽略這筆有缺失的資料,應該是可以承擔的損失;但有時候資料已經不多,或是這個數值的遺失本身就具有意義,這時候怎樣「正確的」補上資料,就很有實務上的價值。

一般填補遺失資料的方法有幾種:

  • 填上空白值(0 或 -1)
  • 填上平均值(或分組的平均值)
  • 用其他資料的數值來預測

Google 的文件裡並沒有說明 Smart  Autofill 使用的是哪一種方式,不過從文件裡的範例來看,應該是第三種,因為自動補值還會提供準確度或錯誤率的資訊,所以至少是用迴歸(regression)或其它統計模型來做預測。

這個功能解決了資料分析實務上很常見又令人頭疼的問題,雖然自動補值所使用的的統計模型沒有說明得很清楚,也沒有什麼參數可以調整,但是這已經比很多初階的資料分析員更「內行」了。

附帶分享一個從 Twitter 的資料裏學到的 imputation 技巧:如果欄位 X 有遺失值,除了補值之外,另外創造一個變數 X_missing,填入 0 或 1,來代表 X 這一欄是否有 missing,這樣既可以正常使用 X 這個欄位,又可以保留 X 是否遺失額外的意義(一個人的發言裡髒話多少,跟是否從來沒有出現過髒話,意義是不一樣的)。雖然這樣一來變數的數量會多一倍,但「寬資料」正是 Big Data 時代為我們從資料中尋找洞見的新契機。


2014/11/08

[摘譯] 人腦對人腦的直接通訊

[原文] Direct brain-to-brain communication demonstrated in human subjects -- ScienceDaily

[摘譯]
這應該算是全新的研究領域,由神經科學家和機器人工程學者所組成的跨國、跨領域研究團隊,共同探索「人腦對人腦」直接通訊的可能性。

「我們想要知道,透過現有的通訊技術,我們是不是有可能做到:藉由讀取一個人的腦部活動,傳到另一個地方,然後把這些腦部活動傳給另一個人,而達到溝通的功能。」

哈佛大學醫學中心教授 Alvaro Pascual-Leone 解釋,他們希望使用通信技術直接傳輸腦活動的資料,避開「打字」或「說話」,讓遠在印度和法國的兩個人知道彼此在想什麼。

研究結果是肯定的。

研究人員讓在印度的受試者想著 "halo" 或 "ciao" 這種問候語,錄下的 EEG 訊號用電子郵件寄到法國,然後法國的電腦會把收到的 e-mail 內容轉換成「顱外磁刺激」訊號(Transcranial magnetic stimulation, TMS),在受試者的大腦產生一些微弱的視覺刺激。結果,這種通訊方式的錯誤率相當低,只有 15%。

傳統的「腦機界面」研究(Brain-Computer-Interface, BCI),是擷取人的腦活動訊號讓機器解讀,這個「腦對腦通訊」則是 BCI + CBI,先擷取人腦的活動信號,再用電腦讓人讀懂這個訊號。

如果這樣的技術發展成熟,「心電感應」也將變成人人皆有的超能力。


[研究論文] 
  1. Carles Grau, Romuald Ginhoux, Alejandro Riera, Thanh Lam Nguyen, Hubert Chauvat, Michel Berg, Julià L. Amengual, Alvaro Pascual-Leone, Giulio Ruffini.Conscious Brain-to-Brain Communication in Humans Using Non-Invasive TechnologiesPLoS ONE, 2014; 9 (8): e105225 DOI:10.1371/journal.pone.0105225

2014/11/02

文山文海

[原文] The top 100 papers | Nature

Citation,引文,指的是一篇發表出來的學術論文所參考的過去研究;而一篇研究論文被引用的次數,大致上可以表現出這個成果在整個學術領域裡的重要性。

五十年前(1964),Eugene Garfield 發表了「科學引文索引」(Science Citation Index, SCI),自此開始建立了對科學研究論文系統化的引用分析。就像前一段所提的,一篇文章被引用的次數,某種程度上可以用來代表它的重要性,所以也漸漸成為學術界常用的「績效指標」。

而華人擅長對任何指標「最佳化」的天性,也引領台灣的學術界一路發展到今天「SCI至上」的現況。(其實大陸也差不多,所以用「華人」。)

言歸正傳,Nature 為了慶祝 SCI 的 50 週年慶,請 SCI (已更名 Web of Science, WOS)的母公司 Thomson Reuters 提供所有索引文獻裡被引用最多的前 100 名,看看這些都是些什麼研究,以及他們的具體貢獻大致是什麼。(Web of Science Top 100.xls

SCI 所收錄自1900年到2014年九月的學術論文,總計57,783,627篇(大約五千八百萬,如果數字太難讀的話),可以說是文山文海。然而其中 44% (大約兩千五百萬篇)從來沒被引用過,連同被引用10次以下的佔 75%,而真正被引用「上萬次」的,只有 148 篇(0.00025%)。

即便是前十名的論文,被引用次數也有極大的差異:第一名被引用了30多萬次,第二名21萬,第三名15萬次;然而第四到第十名被引用的次數「只有」4~6萬次。

從前100強的論文來看,生物醫學領域的佔多數,方法學的論文也佔多數,但是直接跟諾貝爾獎得獎研究有關的反而不多。報導裡指出有兩篇(Fred Sanger 以及 Kary Mullis),讀者回應裡又多指出兩篇(Neher & Sakmann 以及 Köhler & Milstein),顯然從「被引用次數」算出來的重要性,跟諾貝爾獎委員會認為的重要性,有著某種程度的差異存在。

至於差異是什麼,很多批評 SCI 亂象的學者都有精闢的見解,對非學術圈的人來說,倒也不是太重要。

這篇報導的後半,依據從這前100名論文的分析,提出了若干「如何讓你的研究被更多人引用」的建議,有興趣的讀者可以自己看原文,我就不多事了。(看不懂的話,大概這些建議的幫助也不大,先練習英文吧。)